Wprowadzenie

Zrównoważony rozwój jest koncepcją, która zakłada równoczesne uwzględnianie trzech kluczowych wymiarów: ekonomicznego, społecznego i środowiskowego, w celu zapewnienia dobrobytu obecnym i przyszłym pokoleniom. Idea ta zyskała na znaczeniu w obliczu rosnących wyzwań związanych z degradacją środowiska, nierównościami społecznymi oraz koniecznością utrzymania stabilnego wzrostu gospodarczego. Zrównoważony rozwój dąży do harmonijnego łączenia tych trzech sfer, tak aby postęp ekonomiczny nie odbywał się kosztem środowiska naturalnego i aby każdy człowiek miał równy dostęp do zasobów oraz usług publicznych, takich jak edukacja, opieka zdrowotna i godne warunki mieszkaniowe. Ze względu na zróżnicowanie gospodarcze, demograficzne i środowiskowe, województwa w Polsce różnią się znacznie pod względem poziomu rozwoju oraz występujących problemów. Dlatego analiza tych różnic, w kontekście zrównoważonego rozwoju, pozwala na bardziej precyzyjne określenie potrzeb rozwojowych oraz dostosowanie polityk regionalnych.

Cel badania

Celem opracowania jest porównanie poziomu zrównoważonego rozwoju w województwach Polski oraz sklasyfikowanie ich w ranking w oparciu o dwie metody porządkowania liniowego (bezwzorcową i wzorcową), a także dokonanie ich klasteryzacji w większe, podobne do siebie grupy. Okres badań to 2022 rok. Dane pochodzą z Banku Danych Lokalnych. Zachowując podstawową zasadę zrównoważonego rozwoju, czyli traktowanie wszystkich wymiarów równorzędnie, uznałam, iż do każdego z nich trzeba przyjąć taką samą liczbę zmiennych.

Zestaw danych


Exploratory Data Analysis

Na początku wyświetlę strukturę moich danych, aby uzyskać podstawowe informacje o zestawie danych, którym będę się zajmować.

## tibble [16 × 16] (S3: tbl_df/tbl/data.frame)
##  $ Nazwa: chr [1:16] "DOLNOŚLĄSKIE" "KUJAWSKO-POMORSKIE" "LUBELSKIE" "LUBUSKIE" ...
##  $ X1   : num [1:16] 76748 56774 47611 56701 66393 ...
##  $ X2   : num [1:16] 6945 5889 5910 6014 6211 ...
##  $ X3   : num [1:16] 81765 52369 32603 59346 59361 ...
##  $ X4   : num [1:16] 4.5 7.3 8 4.4 5.5 4.4 4.3 5.9 8.8 7 ...
##  $ X5   : num [1:16] 11.86 8.48 8.55 9.47 8.87 ...
##  $ X6   : num [1:16] 4.56 3.5 4.56 2.79 5.13 4.25 5.19 2.86 3.2 4.93 ...
##  $ X7   : num [1:16] 31.3 30 31.5 30.1 34.1 27.1 28.9 30.7 27.8 29.4 ...
##  $ X8   : num [1:16] 946 860 900 929 934 929 970 953 896 915 ...
##  $ X9   : num [1:16] 31.7 28.3 31.3 30 32 31 33.3 31.8 29 32.2 ...
##  $ X10  : num [1:16] 9 17.7 22.6 13.3 14.1 13.6 10.6 12.1 17.4 23.4 ...
##  $ X11  : num [1:16] 0.07 0.1 0.04 0.04 0.08 0.07 0.05 0.11 0.05 0.02 ...
##  $ X12  : num [1:16] 805 529 230 147 2240 ...
##  $ X13  : num [1:16] 611 380 209 233 468 ...
##  $ X14  : num [1:16] 18.6 31.8 22.7 39 19.6 ...
##  $ X15  : num [1:16] 4.17 9.91 5.34 12.57 8.76 ...


Wszystkie zmienne diagnostyczne są numeryczne. Sprawdzę jeszcze czy nie występują żadne braki w danych.

##  /\     /\
## {  `---'  }
## {  O   O  }
## ==>  V <==  No need for mice. This data set is completely observed.
##  \  \|/  /
##   `-----'

##    Nazwa X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15  
## 16     1  1  1  1  1  1  1  1  1  1   1   1   1   1   1   1 0
##        0  0  0  0  0  0  0  0  0  0   0   0   0   0   0   0 0


Braków w danych nie ma, więc teraz wyświetlę statystyki opisowe zmiennych diagnostycznych.

Statystyki opisowe zmiennych diagnostycznych
Minimum Mediana Maksimum Skośność Kurtoza Średnia Odchylenie standardowe
X1 47611.00 57548.50 107711.00 1.63 5.72 62591.94 15271.08
X2 5662.53 6076.93 7913.14 1.34 4.40 6286.70 595.12
X3 32603.00 53150.50 108144.00 0.95 3.17 58555.62 20534.60
X4 2.90 5.70 8.80 0.12 1.70 5.90 1.87
X5 7.23 8.71 14.27 0.99 3.12 9.55 1.95
X6 2.79 4.14 5.19 -0.04 1.73 3.99 0.80
X7 27.10 30.05 34.10 0.35 2.14 30.14 2.16
X8 857.00 922.00 970.00 -0.29 2.13 917.12 33.44
X9 27.60 30.90 33.30 -0.46 2.65 30.70 1.51
X10 7.80 13.90 23.40 0.47 2.52 14.91 4.46
X11 0.02 0.06 0.29 2.60 9.58 0.07 0.06
X12 66.63 410.00 2636.04 1.24 3.30 754.91 800.87
X13 170.09 375.02 1262.80 1.69 5.76 448.20 276.04
X14 18.60 31.72 65.07 0.95 3.19 33.59 13.01
X15 3.06 5.48 12.57 1.08 3.60 6.15 2.56



Przedstawię teraz rozkłady zmiennych diagnostycznych na wykresach pudełkowych.



Jak widzimy, większość zmiennych diagnostycznych charakteryzuje się prawostronną asymetrią oraz istnieją wartości odstające (czerwone kropki). Aby osłabić to zjawisko, ograniczę wartości zmiennych skrajnych do wartości dolnego lub górnego wąsa tj. odpowiednio do wartości Q1-1,5* (Q3-Q1) oraz Q3+1,5* (Q3-Q1). Taki zabieg modyfikuje wyjściowe dane, ale w kontekście budowania rankingu nie ma to większego znaczenia. Ograniczenie odstających wartości można wyjaśnić tym, że wpływ wartości pojedynczej cechy nie może wpływać w nieograniczonym stopniu na poziom zrównoważonego rozwoju w województwach.

Teraz jeszcze raz wyświetlę wykresy pudełkowe i statystyki opisowe zmiennych diagnostycznych po usunięciu outlierów.


Statystyki opisowe zmiennych diagnostycznych po modyfikacji wartości odstających
Minimum Mediana Maksimum Skośność Kurtoza Średnia Odchylenie standardowe
X1 47611.00 57548.50 94288.88 1.01 3.54 61753.05 12795.30
X2 5662.53 6076.93 7904.80 1.34 4.36 6286.18 593.60
X3 32603.00 53150.50 101538.88 0.78 2.67 58142.80 19512.17
X4 2.90 5.70 8.80 0.12 1.70 5.90 1.87
X5 7.23 8.71 14.27 0.99 3.12 9.55 1.95
X6 2.79 4.14 5.19 -0.04 1.73 3.99 0.80
X7 27.10 30.05 34.10 0.35 2.14 30.14 2.16
X8 857.00 922.00 970.00 -0.29 2.13 917.12 33.44
X9 28.30 30.90 33.30 -0.12 2.40 30.80 1.32
X10 7.80 13.90 23.40 0.47 2.52 14.91 4.46
X11 0.02 0.06 0.15 0.87 3.12 0.07 0.04
X12 66.63 410.00 2248.23 1.09 2.81 730.67 743.99
X13 170.09 375.02 869.92 0.76 2.63 423.64 207.78
X14 18.60 31.72 65.07 0.95 3.19 33.59 13.01
X15 3.06 5.48 10.50 0.67 2.44 6.02 2.24

Jak moża zauważyć, dzięki modyfikacji kilku wartości pozbyłam się outlierów. Wartości przybliżają się do wartości Q1 i Q3, w rezultacie wąsy sięgają nowych, bardziej zewnętrznych wartości, które wcześniej były uważane za outliery.


Charakterystyka zmiennych diagnostycznych:

Większość zmiennych wykazuje prawostronną skośność, co sugeruje, że w wielu województwach obserwowane są wartości poniżej średniej, z kilkoma wyjątkami osiągającymi znacznie wyższe wyniki. Zmienne takie jak PKB per capita, wynagrodzenia czy liczba nowych rejestracji wskazują na nierówności w rozwoju gospodarczym. Wysoka kurtoza w wielu przypadkach potwierdza koncentrację danych wokół mediany oraz intensywność wartości skrajnych, co może sugerować występowanie wyjątkowych przypadków w danym województwie.

Niektóre zmienne, takie jak liczba lekarzy oraz bezrobocie, wykazują bliską zeru skośność, co sugeruje bardziej symetryczny rozkład i równomierny dostęp do tych zasobów w różnych regionach. Z kolei zmienne związane z ochroną środowiska, takie jak emisja gazów czy udział obszarów chronionych, wskazują na duże zróżnicowanie, co może sugerować różne polityki i podejścia do ochrony środowiska w różnych województwach.

Przedstawienie zmiennych na wykresach, podział na trzy wymiary

Wymiar ekonomiczny

  • Biorąc pod uwagę wymiar ekonomiczny województwo mazowieckie wydaje się być najlepsze, natomiast najgorsze warmińsko-mazurskie.

  • Mieszkańcy województw: mazowieckiego, dolnośląskiego, śląskiego, małopolskiego i pomorskiego zarabiają przecietnie więcej, niż mieszkańcy innych województw.

  • Najmniej produkcji przemysłu ogółem na jednego mieszkańca, zostało sprzedane w województwach: warmińsko-mazurskim, świętokrzyskim i lubelskim.

  • Najciężej pracę jest znaleźć w województwie warmińsko-mazurskim i podkarpackim. Duże problemy mogą też napotkać mieszkańcy województwa zachodnio-pomorskiego, kujawsko-pomorskiego, świętokrzyskiego i podlaskiego.

  • Najmniej nowych jednostek gospodarczych w rejestrze REGON zostało zarejestrowanych w województwie opolskim, a najwięcej w województwie mazowieckim.

Wymiar społeczny

  • Najwięcej lekarzy jest dostępnych w województwie mazowieckim i łódzkim. Najmniej w województwie lubuskim, opolskim i warmińsko-mazurskim. Być może mieć na to realny wpływ dostępność uczelni wyższych i kierunków lekarskich w tych województwach.

  • Współczynik obciążenia demograficznego oznacza proporcję liczby osób w wieku poprodukcyjnym do liczby osób w wieku produkcyjnym. Najgorzej ta sytuacja kształtuje się w województwach: świętokrzyskim i łódzkim.

  • Północna część Polski charakteryzuje się tym, że mniejszy odsetek dzieci w wieku 3-5 lat uczęstsza do przedszkoli, odwrotna sytuacja ma miejsce w województwach południowo-zachodniej Polskii województwie mazowieckim.

  • Ubóstwo skrajne dotyka głównie północno-wschodnią Polskę, natomiast w województwach: mazowieckim, dolnośląskim i śląskim zagrożenie jest dużo niższe.

Wymiar środowiskowy



  • Najgrosza sytuacja środowiskowa związana z emisja zanieczyszczeń gazowych i pyłowych ma miejsce w województwach: śląskim i łódzkim. Wchodnia część Polski, charakteryzuje się lepszą jakością powietrza,

  • Najwięcej oczyszczalni ścieków zanjduje się w województwach: małopolskim, śląskim i mazowieckim - to te regiony mają najwyższy procent oczyszczonych ścieków komunalnych.

  • Najmniej obszarów prawnie chronionych jest w województwie zachodnio-pomorskim, dolnośląskim, śląskim i łódzkim. Województwo świętokrzystkie zajmuje pierwsze miejsce wśród wojwództw pod tym względem.

  • Najwięcej zasobów eksploatacyjnych wód podzielmnych znajduje się w województwie lubuskm i kujawsko-pomorskim, a najmniej w województwie podkarpackim i zachodnio-pomorskim.

Macierz korelacji zmiennych diagnostycznych

Teraz przedstawię macierz korelacji pomiędzy zmiennymi diagnostycznymi i sprawdzę zależności zachodzące pomiędzy nimi.

Ten wykres wyraźnie pokazuje, że duża część zmiennych diagnostycznych jest ze sobą skorelowana w stopniu wysokim.

Silne korelacje dodatnie:
  • X1 (PKB per capita) z X2 (Przeciętne wynagrodzenie): 𝑟=0.86

Wysoka dodatnia korelacja sugeruje, że województwa z wyższym PKB per capita mają także wyższe przeciętne wynagrodzenie.

  • X1 z X3 (Produkcja sprzedana przemysłu): 𝑟=0.88

Bardzo silna dodatnia korelacja, co sugeruje, że województwa z wyższym PKB per capita mają również wyższą produkcję przemysłową na mieszkańca.

  • X3 z X8 (Dzieci w przedszkolach): 𝑟=0.70

Wyższa produkcja przemysłowa jest powiązana z większą liczbą dzieci w przedszkolach.

  • X12 (Emisja zanieczyszczeń gazowych) z X11 (Emisja zanieczyszczeń pyłowych): 𝑟=0.84

Silna korelacja między tymi dwiema zmiennymi sugeruje, że województwa z wyższą emisją gazów mają także wyższą emisję pyłków.

Silne korelacje ujemne:
  • X4 (Bezrobocie) z X1, X2, X3: 𝑟= −0.86, −0.79, −0.86

Wysoka ujemna korelacja z PKB per capita, wynagrodzeniem oraz produkcją sugeruje, że wyższe bezrobocie jest związane z niższym poziomem rozwoju gospodarczego.

  • X10 (Wskaźnik zagrożenia ubóstwem) z X1, X2, X3: r=−0.70,−0.78,−0.77

Silna ujemna korelacja wskazuje, że wyższe zagrożenie ubóstwem występuje w województwach z niższym PKB i wynagrodzeniem.

  • X4 (Bezrobocie) z X8 (Dzieci w przedszkolach): r=−0.74

Wysoka ujemna korelacja wskazuje, że wyższe bezrobocie jest związane z mniejszą liczbą dzieci w przedszkolach.


Wykresy zależności pomiędzy zmiennymi diagnostycznymi



Każda kropka na wykresie reprezentuje jedno województwo Polski. Łatwo dostrzec, że jedno z nich wyraźnie odróżnia się od reszty. Aby odpowiedzieć na pytanie, które to województwo, przedstawię wyniki na mapie województw.

Jak widzimy jest to województwo mazowieckie, które charakteryzuje się najwyższym PKB per capita oraz najwyższym średnim miesięcznym wynagrodzeniem. Na szczególną uwagę zasługuje tutaj województwo wielkopolskie, w którym mimo stosunkowo wysokiego PKB, średnie wynagrodzenia są niższe niż by tego oczekiwano. Teraz sprawdzę jak kształtuje się zależność pomiędzy PKB, a stopą bezrobocia rejestrowanego oraz liczbą nowych jednostek w REGON.




Cechy te, także wykazują dużą zależność między sobą. Wraz ze wzrostem PKB, stopa bezrobocia rejestrowanego maleje, natomiast jednostek nowo zarejestrowanych w rejestrze REGON przybywa. Popatrzmy jak to się kształtuje w poszczególnych województwach.

Nawięcej nowych jednostek gospodarczych zakłada się w województwie mazowieckim, duży przyrost notują także w województwa pomorskie, dolnośląskie i małopolskie. Najmniej jednostek powstaje w województwie śląskim.

Województwo podkarpackie i warmińsko-mazurskie charakteryzuje się najwyższą stopą bezrobocia. Najlepiej sytuacja w kontekście niskiej stopy bezrobocia wygląda w województwie wielkopolskim i śląskim.

Jak załadanie nowych spółek wpływa na wynagrodzenie i bezrobocie?



Widzimy, że wraz z powstawaniem nowych jednostek gospodarczych, wzrasta średnie miesięczne wynagrodzenie. Powstawanie nowych firm prowadzi do większej konkurencji o pracowników. Firmy są zmuszone oferować wyższe wynagrodzenia oraz lepsze warunki pracy, aby przyciągnąć i zatrzymać pracowników. Jeżeli chodzi o stopę bezrobocia możemy tutaj zauważyć odwrotny trend. Nowo powstające przedsiębiorstwa generują popyt na pracowników, co prowadzi do tworzenia nowych miejsc pracy. W miarę jak firmy się rozwijają, zatrudniają pracowników, co bezpośrednio wpływa na zmniejszenie liczby osób zarejestrowanych jako bezrobotne.


Czy stopa bezrobocia wpływa na liczbę dzieci w przedszkolach?




Podzieliłam województwa na trzy grupy według odsetka dzieci w wieku 3-5 lat uczęszczających do przedszkoli. Można zauważyć, że wyższa stopa bezrobocia jest skorelowana z mniejszym udziałem dzieci w przedszkolach, co sugeruje, że w regionach o większym bezrobociu rodziny są mniej skłonne do posyłania dzieci do placówek edukacyjnych. Zobaczmy, które to województwa:

Województwa: warmińsko-mazurskie, podkarpackie i kujawsko-pomorskie, które charakteryzują się wysoką stopą bezrobocia, wykazują niższy odsetek dzieci uczęszczających do przedszkoli. Natomiast w województwach, w których stopa bezrobocia jest niższa np. wielkoposlkie, mazowieckie, duży odsetek dzieci chodzi do przedszkoli.

Czy im większa produkcja sprzedana przemysłu na 1 mieszkańca tym większy poziom zanieczyszczń powietrza?



Nie wszystkie branże przemysłowe mają taki sam wpływ na jakość powietrza. Przemysł lekki, technologiczny lub usługi mają znacznie mniejszy wpływ na poziom zanieczyszczeń w porównaniu do przemysłu ciężkiego. Taki przemysł charakteryzuje województwo wielkopolskie i mazowieckie, w przeciwienstwie do województwa śląskiego, w którym przemysł cięzki ma największy udział.

Porządkowanie liniowe

Metoda bezwzorcowa - metoda standaryzowanych sum


W metodach bezwzorcowych obliczenia polegają na uśrednieniu wartości zmiennych unormowanych. Bazują na funkcji, której argumentami są cechy opisujące obiekty.

Najpierw zamieniłam destymulanty (\(X_4\), \(X_7\), \(X_{10}\), \(X_{11}\), \(X_{12}\)) na stymulanty i dokonałam standaryzacji. Następnie zsumowałan uzyskane oszacowania według wzoru: \[s_i = \frac{1}{m} \sum_{j=1}^{m} \ z_{ij}\] Nie używałam wag, ponieważ uznałam, że każdy wymiar i każda zawarta zmienna jest tak samo ważna w kontekście badania zróżnicowania województw pod względem zrównoważonego rozwoju. Na końcu standaryzuje uzyskane wartości według wzoru: \[S_i = \frac{s_i - \min(s_i)}{\max[(s_i) - \min(s_i)]}\]

Metoda wzorcowa - metoda Hellwiga


W metodach wzorcowych obliczenia polegają na wyznaczeniu odległości poszczególnych obiektów od zdefiniowanego wzorca.

Najpierw zamieniłam destymulanty (\(X_4\), \(X_7\), \(X_{10}\), \(X_{11}\), \(X_{12}\)) na stymulanty i dokonałam standaryzacji. Utworzyłam wzorzec: \[ d_j^+ = \max_{i=1}^{n} z_{ij} \] Następnie obliczyłam odległość poszczególnych obiektów od wzorca: \[ d_i = \sqrt{\sum_{j=1}^{m} (x_{ij} - d_j^+)} \] Następnie wybrałam “dostatecznie” dużą odległość \(d_0\):

\[ d_0 = \bar{d_i} + 2 \cdot s(d_i) \]

A na końcu znalazłam wartość miary dla każdego obiektu: \[ S_i = 1 - \frac{d_{i_0}}{d_0} \] W ten sposób otrzymałam tabelę z rankingiem województw polski - od najlepszego do najgorszego, z rozdzieleniem na trzy wymiary (ekonomiczny, społeczny i środowiskowy, brane pod uwagę przy badaniu poziomu zrównoważonego rozwoju w województwach.

  • Analizując wymiar ekonomiczny, można stwierdzić, że zdecydowanie najlepsze pod tym względem było województwo mazowieckie, dolnośląskie, wielkopolskie (w metodzie bezwzorcowej) i pomorskie (w metodzie wzorcowej). Najsłabsze (w obydwóch metodach) było województwo warmińsko-mazurskie. Większość województw uzyskała te same miejsca w dwóch metodach porządkowania liniowego.

  • W przypadku wymiaru społecznego najsłabiej wypada województwo kujawsko-pomorskie (metoda standaryzowanych sum) i warmińsko-mazurskie (metoda Hellwiga). Jednoznacznie najkorzystniejsza sytuacja kształtuje się w województwie mazowieckim. Następnie w województwie dolnośląskim, małopolskim i wielkopolskim. Rankingi nie różnią się od siebie za bardzo - duża część województw uzyskała te same miejsca w obydwóch metodach.

  • Biorąc pod uwagę wymiar środowiskowy, uwidaczniają się znaczne różnice w stosunku do dwóch poprzednich wymiarów. Województwo warmińskomazurskie, które pod względem ekonomicznym i społecznym było najsłabsze, w wymiarze środowiskowym zajmuje wysokie miejsca w rankingu (odpowiednio 3 i 5). Najlepszym (w metodzie bezwzorcowej) okazało się województwo lubuskie, natomiast w metodzie wzorcowej województwo małopolskie. Ciekawym przypadkiem jest województwo śląskie i opolskie, które w wymiarze środowiskowym zajmują dwie skrajne lokaty (w zależności od wybranej metody porządkowania). W porównaniu do dwóch poprzednich wymiarów lokaty zajmowane przez województwa w rankingach różnią się w zależności od wybranej metody.

  • Analizując wszystkie trzy wymiary, ogólnie można stwierdzić, że województwo mazowieckie charakteryzowało się najkorzystniejszą sytuacją (4 na 6 razy zajęło pierwsze miejsce), a najmniej korzystną województwo warmińsko-mazurskie (3 na 6 razy zajęło ostatnie miejsce i raz przedostatnie).

Porównanie wyników na wykresach radarowych

Wymiar ekonomiczny

Przedstawiłam charakterystyke najlepszego województwa (mazowieckie) oraz najgorszego (warmińsko-mazurskie) pod względem ekonomicznym. Łatwo zauważyć, że województwo warmińsko-mazurskie jest pod każdym względem dużo gorsze od województwa mazowieckiego.

Wymiar społeczny

Województwo mazowieckie - lider w klasyfikacji społecznej wyróżnia szerszy dostęp do opieki medycznej oraz większe mieszkania. Natomiast w województwie kujawsko-pomorskim, występuje wysoi wskaźnik zagrożenia ubóstwem.

Wymiar środowiskowy

Województwo małopolskie charakteryzuje duży udział obszarów chronionych, natomiast województwo śląskie, które zajęło ostatnie miejsce w tym rankingu niestety zmaga się z dużą emisją zanieczyszceń.

Ogólna klasyfikacja województw pod względem poziomu zrównoważonego rozwoju

Następnie na podstawie wybranych zmiennych obliczyłam poziom zrównoważonego rozwoju dla wszystkich województw. Im wyższe wartości, tym wyższy poziom zrównoważonego rozwoju.



  • Rankingi są do siebie zbliżone, częstą jest sytuacja, że dane województwo zajmuje to samo miejsce w obydwóch rankingach. W ogólnej klasyfikacji województwo mazowieckie uzyskało najwyższe lokaty w obydwóch rankingach. Za najsłabsze można uznać województwo warmińsko-mazurskie (które uzyskało raz ostatnie miejsce i raz przedostatnie) oraz województwo świętokrzyskie (w metodzie Hellwiga).

  • Największa różnica w pozycjach między rankingami to 3 miejsca (województwo świętokrzyskie).

  • Województwa: dolnośląskie, kujawsko-pomorskie, lubelskie, lubuskie, łódzkie, małopolskie, mazowieckie i śląskie otrzymały takie same lokaty w rankingach.

  • Dla każdej z metod obliczyłam średnią wartość wskaźnika dla wszystkich województw. W obydwóch metodach ponad średnią wartością znajdowało się 7 województw – w każdym przypadku były to te same województwa. Można je uznać za te, które mają najwyższy poziom rozwoju. Były to: dolnośląskie, lubuskie, małopolskie, mazowieckie, pomorskie, śląskie i wielkopolskie.



Teraz przedstawię na wykresie radarowym najlepsze i najgorsze województwo:

Jak widzimy, obydwa województwa są na podobnym poziomie, jeżeli chodzi o wymiar środowiskowy. Jednak w idei zrównoważonego rozwoju, wszytskie trzy wymiary muszą być jak najwyższe, z tego właśnie powodu województwo mazowieckie, które dwa pozostałe wymiary ma na wysokim poziomie, prowadzi w ogólnym rankingu zróżnicowania poziomu zrównoważonego rozwoju wśród województw Polski.

Grupowanie według średniej

W celu dokładniejszego zaobserwowania przestrzennego zróżnicowania poziomu zrównoważonego rozwoju w Polsce, zgodnie z zasadą jednego odchylenia od średniej, ze względu na wartość zmiennej syntetycznej dokonałam podziału województw na cztery grupy:

  • grupa I - województwa o największym poziomie zrównoważonego rozwoju, dla których wartość miary wskaźnika spełnia warunek: \[ r > \overline{x} + S_{x} \]

  • grupa II - województwa o ponadprzeciętnym poziomie zrównoważonego rozwoju, dla których wartość miary wskaźnika spełnia warunek: \[ r \in \left(\overline{x}, \overline{x} + S_{x}\right] \]

  • grupa III - województwa o przeciętnym poziomie zrównoważonego rozwoju, dla których wartość miary wskaźnika spełnia warunek: \[ r \in \left(\overline{x} - S_{x}, \overline{x}\right] \]

  • grupa IV - województwa o nikim poziomie zrównoważonego rozwoju, dla których wartość miary wskaźnika spełnia warunek: \[ r \leq \overline{x} - S_{x} \]

Gdzie:

\({\overline{x}}\)- średnia wartości rozważanego wskaźnika

\(S_{x}\) - odchylenie standardowe wartości rozważanego wskaźnika



Poniższe wykresy przedstawiają zróżnicowanie przestrzenne województw Polski ze względu na poziom zrównoważonego rozwoju.

Rankingi są do siebie bardzo zbliżone, większość województw należy do tych samych grup w obydwóch rankingach. Różnica polega na tym, że województwa: lubelskie i podkarpackie w metodzie standaryzowanych sum są w grupie wyżej, niż w metodzie Hellwiga. Natomiast województwo świętokrzystkie w metodzie Hellwiga plasuje się w grupie wyżej, niż w drugiej metodzie.

Na koniec oszacuję współczynnik korelacji tau Kendalla, który opisuje związek między rankingami wyznaczonymi na podstawie metod standaryzowanych sum i Hellwiga.

Korelacja pomiędzy metodami wynosi 0,908. Jest to bardzo silna dodatnia zależność, co pokazuje, że obydwiema metodami uzyskałam zbliżone do siebie wyniki. Taki wynik sugeruje, że obie metody są spójne w swojej ocenie analizowanych danych.

Podsumowanie

Poziom zrównoważonego rozwoju na podstawie przeprowadzonej analizy wykazuje znaczne zróżnicowanie. Bazując na wykonanych obliczeniach, można stwierdzić, że: - W wymiarze ekonomicznym i społecznym najkorzystniej wypadło województwo mazowieckie, a najsłabiej warmińsko-mazurskie. - Pod względem środowiskowym najwyższymi pozycjami charakteryzowało się województwo lubuskie i małopolskie, a najniższymi – opolskie i śląskie. - Na podstawie rankingów województw uwzględniających łącznie wszystkie wymiary najlepsze było województwo mazowieckie, a najsłabsze warmińsko–mazurskie oraz świętokrzyskie. - Oprócz województwa mazowieckiego wysokim poziomem rozwoju wyróżniały się województwa: dolnośląskie, małopolskie, pomorskie i wielkopolskie. - Rankingi otrzymane dwoma różnymi metodami (bezwzorcowąi wzorcową) są do siebie bardzo zbliżone, co potwierdza silna dodania korelacja tau Kendalla.

Analiza skupień

Wybór liczby skupień

W wybraniu odpowiedniej ilości klastrów pomogą mi różne metody i indeksy, które służą do identyfikacji optymalnej liczy klastrów.

Metoda “łokcia”

Jedną z nich jest metoda łokcia, która polega na tym, aby łączna suma wariancji w poszczególnych grupach była jak najmniejsza. Czym mniejsza ta wariancja tym grupy będą zawierały bardziej zbliżone obserwacje.

W tym wykresie na osi poziomej umieszcza się liczbę grup (klastrów), a na pionowej sumę kwadratów odległości poszczególnych obserwacji od centroidów. Wybiera się liczbę grup, przy której jest widoczne znaczne załamanie spadku sumy kwadratów – dodanie kolejnej grupy nie przynosi już aż tak dużych korzyści.

Patrząc na wykres cięzko jednoznacznie określić punkt, od którego wariancja już nie zmienia się aż tak bardzo, liczyłam na to, że na wykresie będzie widoczne silne zagięcie tzw. “łokieć”, który jednoznacznie określi najlepszą ilość klastrów. Wydaje mi się, że w okolicach 4-6 grup wariancja przestaje spadać już dosyć widocznie, spada o kilka jednostek, a wykres zaczyna się wypłaszcać, więc okolice tych grup wydają sie być korzystne. Aczkolwiek, nie uzyskałam zbytnio konkretnych odpowiedzi na pytanie jaka ilość klastrów jest odpowiednia, dlatego skorzystam z kolejnej metody.

Indeks Silhouette


Silhouette nazywany jest miarą wewnętrzną, ponieważ wykorzystuje w swej ocenie średnią odległość pomiędzy obserwacjami wewnątrz grupy (a) i średnią odległość obserwacji do najbliższej „obcej” grupy (b). Poniżej wzór:

\[ \frac{1}{n} \sum_{i=1}^{n} s(i) \]

\[ s(i) = \frac{b(i) - a(i)}{\max\{a(i), b(i)\}} \]
gdzie: \(a(i)\) oznacza średnią odległość punktu do innych punktów znajdującym się w tym samym klastrze (naturalnie oczekuje się jak najmniejszej wartości, żeby klastry zawierały jak najbardziej zbliżone obserwacje)

\(b(i)\) jest średnią odległościa od punktów znajdujących się w innym klastrze, ale bedącym najbliżej (tutaj natomiast oczekujemy jak największej wartości, co będzie oznaczać ze obserwacja jest daleko od innych klastrów)
Zobaczę jak wygląda to na wykresie:

Indeks ten wskazał, że podzielenie danych na dwie grupy jest najlepsze, osiągając maksymalną wartość. Jednak wartości dla czterech, pięciu i sześciu klastrów również pozostają na wysokim poziomie, co sugeruje zbieżność wyników z metodą łokcia.

Indeks Calińskiego i Harabasza

Jest to kolejny indeks służący do optymalnego wyboru liczby klastrów w analizie skupień. Optymalną liczbą klastrów jest ta, dla której wartość tego wskaźnika osiąga maksimum. Poniżej przedstawiam wzór:

\[ CH = \frac{\frac{BCSS}{k-1}}{\frac{WCSS}{n-k}} \] Gdzie: BCSS – suma kwadratów odległości między klastrami, WCSS – suma kwadratów odległości wewnątrz klastrów, k – liczba klastrów, n – liczba punktów w zbiorze danych.

Zobaczę jak wygląda to na wykresie:

Indeks Calińskiego Harabasza osiąga najwyższą wartość dla dwóch klastrów. Wartości tego indeksu dla trzech, czterech i pięciu klastrów również pozostają na relatywnie wysokim poziomie w porównaniu z innymi rozważanymi liczbami klastrów.

Podsumowanie

Podział województw Polski na dwie grupy w kontekście poziomu zrównoważonego rozwoju jest, moim zdaniem, niewystarczający. Zrównoważony rozwój to złożone zagadnienie, obejmujące aspekty ekonomiczne, społeczne i środowiskowe. Redukcja tego tematu do tylko dwóch kategorii może prowadzić do uproszczeń i zniekształceń. Indeksy wskazują, że optymalnym wyborem byłoby podzielenie województw na 4-6 grup. W związku z tym zdecydowałam się na podział na 4 grupy.

Zmienne
Teraz przedstawię statystyki opisowe zestandaryzowanych danych.
Statystyki opisowe zmiennych diagnostycznych
Minimum 1 kwartyl Mediana 3 kwartyl Maksimum Średnia Odchylenie standardowe
X1 -1.11 -0.87 -0.33 0.50 2.54 0 1
X2 -1.05 -0.64 -0.35 0.70 2.73 0 1
X3 -1.31 -0.74 -0.26 0.44 2.22 0 1
X4 -1.55 -0.82 0.11 0.80 1.61 0 1
X5 -1.19 -0.72 -0.43 0.57 2.42 0 1
X6 -1.50 -0.70 0.19 0.72 1.50 0 1
X7 -1.83 -0.65 0.04 0.84 1.41 0 1
X8 -1.80 -0.65 0.15 0.89 1.58 0 1
X9 -1.89 -0.55 0.07 0.70 1.89 0 1
X10 -1.90 -0.57 0.23 0.43 1.60 0 1
X11 -2.41 -0.55 0.30 0.73 1.30 0 1
X12 -2.04 -0.40 0.43 0.70 0.89 0 1
X13 -1.22 -0.67 -0.23 0.46 2.15 0 1
X14 -1.15 -0.85 -0.14 0.53 2.42 0 1
X15 -1.32 -0.64 -0.24 0.41 2.00 0 1


Jak widzimy, po standaryzacji nie ma obiektów, które mają wartości na moduł większe od 3. Tak jak już sprawdzałam w pierwszej części projektu, korelacja pomiędzy zmiennymi wynosi |r|< 0.9 oraz współczynnik zmienności jest większy niż 10%, a więc wszystkie założenia są spełnione.

Grupowanie podziałowe

Teraz podzielę moje dane na 4 grupy - zgodnie z tym co wcześniej ustaliłam sprawdzając kolejne indeksy. Poniżej cztery grupy województw wraz z zestandaryzowanymi wartościami poszczególnych zmiennych:

Dane dla klastra 1
Wojewodztwo X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 Klaster
DOLNOŚLĄSKIE 1.172 1.110 1.211 0.750 1.185 0.716 -0.534 0.863 0.677 1.326 -0.125 -0.099 0.904 -1.151 -0.822 1
MAZOWIECKIE 2.543 2.727 2.224 0.857 2.420 1.503 0.575 1.581 1.886 0.967 0.446 -0.278 1.033 -0.300 0.274 1
Dane dla klastra 2
Wojewodztwo X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 Klaster
KUJAWSKO-POMORSKIE -0.389 -0.670 -0.296 -0.750 -0.548 -0.608 0.066 -1.708 -1.890 -0.625 -0.982 0.271 -0.211 -0.138 1.733 2
LUBELSKIE -1.105 -0.634 -1.309 -1.125 -0.512 0.716 -0.627 -0.512 0.375 -1.724 0.732 0.672 -1.034 -0.837 -0.303 2
PODKARPACKIE -1.032 -1.051 -0.806 -1.554 -0.841 -0.983 1.083 -0.632 -1.362 -0.558 0.446 0.841 -0.257 0.867 -1.317 2
PODLASKIE -0.869 -0.460 -0.724 -0.589 -0.574 1.178 0.344 -0.064 1.055 -1.904 1.303 0.854 -1.220 -0.125 -1.146 2
ŚWIĘTOKRZYSKIE -0.871 -0.848 -0.873 -1.018 -0.835 -0.533 -1.735 -0.721 -0.455 0.025 -0.982 -0.748 -0.584 2.419 -0.584 2
WARMIŃSKO-MAZURSKIE -0.989 -1.030 -1.078 -1.447 -0.887 -1.233 0.759 -1.798 -1.173 -1.276 1.017 0.893 -1.098 1.010 0.123 2
ZACHODNIOPOMORSKIE -0.268 -0.196 -0.624 -0.429 0.528 0.054 -0.719 -0.512 -0.455 0.317 0.161 0.634 -0.574 -0.923 -1.043 2
Dane dla klastra 3
Wojewodztwo X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 Klaster
ŁÓDZKIE 0.363 -0.127 0.062 0.214 -0.348 1.428 -1.828 0.505 0.904 0.182 -0.411 -2.029 0.211 -1.072 1.223 3
OPOLSKIE -0.396 -0.256 -0.216 0.000 -1.189 -1.408 -0.257 1.073 0.753 0.631 -1.267 -1.237 -0.372 -0.489 -0.176 3
ŚLĄSKIE 0.769 0.744 1.412 1.179 -0.682 0.454 -0.811 1.013 -0.002 1.595 -2.409 -2.040 2.148 -0.876 0.830 3
Dane dla klastra 4
Wojewodztwo X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 Klaster
LUBUSKIE -0.395 -0.458 0.062 0.804 -0.041 -1.495 0.020 0.355 -0.607 0.362 0.732 0.785 -0.916 0.413 1.999 4
MAŁOPOLSKIE 0.090 0.907 -0.330 0.804 0.713 0.329 1.406 0.355 0.149 0.294 -0.125 0.355 1.685 1.422 -0.532 4
POMORSKIE 0.404 0.692 0.243 0.697 1.339 0.491 1.129 -0.751 -0.531 0.272 1.017 0.507 0.311 -0.070 0.131 4
WIELKOPOLSKIE 0.975 -0.449 1.041 1.608 0.272 -0.608 1.129 0.953 0.677 0.115 0.446 0.620 -0.026 -0.149 -0.389 4

Jak widzimy, województwa Polski zostały podzielone na 4 grupy:

  • I grupa: dolnośląskie i mazowieckie

  • II grupa: kujawsko-pomorskie, lubelskie, podkarpackie, podlaskie, świętokrzyskie, warmińsko-mazurskie, zachodniopomorskie

  • III grupa: łódzkie, opolskie, śląskie

  • IV grupa: lubuskie, małopolskie, pomorskie, wielkopolskie

Teraz, aby lepiej przeanalizować sytuację poziomu zróżnicowania zrównoważonego poziomu rozwoju gospodarczego, przedstawię średnią i odchylenie standardowe dla każdej ze zmiennych w poszczególnych klastrach.

Średnie i odchylenia standardowe dla klastra 1
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 Klaster
Średnia 1.857 1.918 1.718 0.803 1.802 1.109 0.020 1.222 1.281 1.147 0.160 -0.188 0.968 -0.726 -0.274 1
Odchylenie st. 0.969 1.143 0.716 0.076 0.873 0.556 0.784 0.508 0.855 0.254 0.404 0.127 0.091 0.602 0.775 0


Klaster 1 – Wysoko rozwinięte regiony

Klaster pierwszy obejmuje województwa o stosunkowo wysokim poziomie rozwoju gospodarczego. Charakteryzują się one wysokim PKB per capita oraz wyższymi niż przeciętnie wynagrodzeniami, co świadczy o dobrym stanie gospodarki i korzystnej sytuacji na rynku pracy. Regiony te mają także wyższy poziom industrializacji, co można wywnioskować z wysokiej produkcji sprzedanej przemysłu na mieszkańca. Niska stopa bezrobocia i dynamiczna przedsiębiorczość sprzyjają stabilności ekonomicznej.

W zakresie społecznym województwa te charakteryzują się lepszą dostępnością opieki zdrowotnej i większą liczbą lekarzy, co może przekładać się na wyższy standard życia. Dobrze rozwinięta edukacja przedszkolna oraz lepsze warunki mieszkaniowe (większa powierzchnia użytkowa na osobę) wskazują na wysoką jakość życia. Niskie zagrożenie ubóstwem skrajnym również świadczy o korzystnej sytuacji społecznej.

Chociaż regiony te mają relatywnie niską emisję zanieczyszczeń, zarówno pyłowych, jak i gazowych, udział obszarów chronionych jest mniejszy niż w innych klastrach. Może to wskazywać na większy nacisk na rozwój gospodarczy kosztem ochrony środowiska. Niemniej jednak, dobra infrastruktura do oczyszczania ścieków pomaga minimalizować negatywny wpływ na środowisko.



Średnie i odchylenia standardowe dla klastra 2
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 Klaster
Średnia -0.789 -0.698 -0.816 -0.987 -0.524 -0.201 -0.118 -0.850 -0.558 -0.821 0.242 0.488 -0.711 0.325 -0.362 2
Odchylenie st. 0.327 0.308 0.324 0.424 0.490 0.891 0.974 0.651 1.024 0.848 0.914 0.585 0.409 1.188 1.054 0


Klaster 2 – Regiony o niższym poziomie rozwoju

Klaster drugi skupia województwa o niższym poziomie rozwoju gospodarczego. Charakteryzuje je niski poziom PKB per capita oraz przeciętne wynagrodzenia, co może świadczyć o problemach gospodarczych i mniejszej atrakcyjności rynku pracy. Stopa bezrobocia jest tutaj stosunkowo wysoka, a dynamika przedsiębiorczości niższa, co ogranicza możliwości wzrostu i rozwoju regionów.

Pod względem społecznym regiony te mają ograniczoną dostępność usług zdrowotnych i edukacyjnych. Mniejsza liczba lekarzy oraz niższa liczba dzieci w placówkach przedszkolnych mogą świadczyć o niedostatecznym poziomie inwestycji w usługi publiczne. Warunki mieszkaniowe również nie należą do najlepszych, a ryzyko ubóstwa skrajnego jest tutaj wyższe niż w pozostałych klastrach, co może wpływać na ogólną jakość życia.

W wymiarze środowiskowym regiony te charakteryzują się wyższymi emisjami zanieczyszczeń pyłowych i gazowych, co może być związane z obecnością przestarzałych technologii przemysłowych. Chociaż udział obszarów chronionych jest większy niż w klastrze 1, infrastruktura środowiskowa, na przykład oczyszczanie ścieków, jest mniej rozwinięta, co negatywnie wpływa na stan środowiska naturalnego.



Średnie i odchylenia standardowe dla klastra 3
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 Klaster
Średnia 0.245 0.120 0.419 0.464 -0.740 0.158 -0.965 0.864 0.552 0.803 -1.362 -1.769 0.662 -0.812 0.626 3
Odchylenie st. 0.591 0.544 0.871 0.628 0.423 1.441 0.797 0.312 0.485 0.722 1.002 0.460 1.319 0.297 0.722 0


Klaster 3 – Regiony o umiarkowanym rozwoju

Klaster trzeci obejmuje województwa o średnim poziomie rozwoju, które charakteryzują się umiarkowanym PKB per capita oraz względnie niską stopą bezrobocia. Wynagrodzenia są nieznacznie wyższe od przeciętnej, co wskazuje na stabilną sytuację na rynku pracy. Choć przedsiębiorczość nie jest tutaj bardzo dynamiczna, regiony te nie mają poważnych problemów gospodarczych.

Pod względem społecznym klaster ten cechuje się niskim obciążeniem demograficznym oraz dobrą dostępnością edukacji przedszkolnej, co pozytywnie wpływa na jakość życia mieszkańców. Warunki mieszkaniowe są lepsze niż przeciętne, co sugeruje wyższy standard życia. Niskie zagrożenie ubóstwem wskazuje na stabilność społeczną.

W zakresie ochrony środowiska regiony te mają niską emisję zanieczyszczeń zarówno pyłowych, jak i gazowych, co może świadczyć o stosunkowo czystym środowisku naturalnym. Mimo to udział obszarów chronionych jest mniejszy, co może wpływać na ograniczone możliwości ochrony bioróżnorodności. Infrastruktura do oczyszczania ścieków jest dobrze rozwinięta, co sprzyja ochronie zasobów wodnych.

Średnie i odchylenia standardowe dla klastra 4
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 Klaster
Średnia 0.268 0.173 0.254 0.978 0.571 -0.321 0.921 0.228 -0.078 0.261 0.517 0.567 0.264 0.404 0.302 4
Odchylenie st. 0.574 0.729 0.577 0.423 0.598 0.921 0.615 0.711 0.607 0.104 0.488 0.182 1.080 0.723 1.166 0


Klaster 4 – Regiony z problemami społecznymi i środowiskowymi

Klaster czwarty reprezentuje województwa o umiarkowanym rozwoju gospodarczym, jednak borykające się z wyższą stopą bezrobocia. Mimo przeciętnych wartości PKB per capita i wynagrodzeń, regiony te mają pewne problemy na rynku pracy, co może wpływać na ogólną sytuację ekonomiczną. Z drugiej strony, widoczna jest tutaj większa dynamika przedsiębiorczości, co może stanowić potencjał do przyszłego rozwoju.

Społecznie regiony te mają większe obciążenie demograficzne, co może stanowić wyzwanie dla systemu opieki społecznej. Dostępność opieki zdrowotnej jest mniejsza, a warunki mieszkaniowe nie są tak dobre jak w klastrze 1 lub 3. Mimo to zagrożenie ubóstwem nie jest tutaj wysokie, co wskazuje na umiarkowany poziom stabilności społecznej.

W zakresie środowiskowym województwa te cechują się wyższą emisją zanieczyszczeń oraz umiarkowanym udziałem obszarów chronionych, co może wpływać na stan środowiska naturalnego. Infrastruktura do oczyszczania ścieków jest na poziomie przeciętnym, co sugeruje potrzebę dalszych inwestycji w ochronę środowiska. Wyższe obciążenie demograficzne oraz wyzwania związane z ochroną środowiska mogą stanowić istotne bariery dla zrównoważonego rozwoju w przyszłości.

Podsumowanie

Podsumowując, klastry te odzwierciedlają zróżnicowane poziomy rozwoju województw w Polsce, zarówno pod względem gospodarczym, społecznym, jak i środowiskowym. Klaster 1 to najbardziej rozwinięte regiony, klaster 2 to obszary o słabszej kondycji gospodarczej, klaster 3 zajmuje pozycję pośrednią, a klaster 4 zmaga się z wyzwaniami społecznymi i środowiskowymi, mimo pewnych pozytywnych aspektów.


Grupowanie hierarchiczne

Przedstawię teraz za pomocą dendogramów grupowanie hierarchiczne metodą Warda i metodą najdalszego sąsiada, gdyż współczynnik oceniający jakość klasteryzacji tych dwóch metod był najwyższy.



Widzimy, że obydwie te metody bardzo podobnie przydzieliły województwa do grup. Tylko dwa województwa: podkarpackie i warmińsko-mazurskie zmieniają swoje miejsca w grupach. Warto również zwrócić uwagę na fakt, że w przypadku metody Warda, trzecia grupa jest bardziej liczna w porównaniu do metody najdalszego sąsiada. Może to świadczyć o tym, że metoda Warda, która minimalizuje sumę kwadratów odległości wewnątrz klastrów, składa się z bardziej jednorodnych jednostek. W efekcie, klaster ten zawiera więcej województw, co może wynikać z różnicy w podejściu obu metod do łączenia klastrów.

W porównaniu z wynikami grupowania podziałowego dostrzegamy pewne różnice. Po pierwsze, województwa takie jak małopolskie, pomorskie i wielkopolskie, które w analizie podziałowej należały do innych klastrów, w hierarchicznym grupowaniu przyłączyły się do regionów o najwyższym poziomie rozwoju. Województwa śląskie, opolskie i łódzkie nadal tworzą odrębną grupę, regionów o umiarkowanym rozwoju. Ciekawym zjawiskiem jest województwo lubuskie, które wcześniej znajdowało się w grupie bardziej rozwiniętych gospodarczo regionów, a obecnie zmieniło swoją przynależność. Pozostałe województwa zachowały te same grupy, co w przypadku grupowania podziałowego.


Podsumowanie

Celem projektu była ocena poziomu zrównoważonego rozwoju województw w Polsce oraz ich klasyfikacja na podstawie wybranych wskaźników ekonomicznych, społecznych i środowiskowych. Przeprowadzono wielowymiarową analizę danych, która obejmowała zarówno ocenę rankingową, jak i klasyfikację za pomocą metod analizy skupień.

W pierwszym etapie projektu obliczono poziom zrównoważonego rozwoju dla wszystkich województw, stosując różne metody oceny, w tym metodę Hellwiga. Wyniki pokazały zbliżone rankingi województw, z niewielkimi różnicami w pozycjach. Województwo mazowieckie uzyskało najwyższe lokaty w obu rankingach, co sugeruje, że jest najbardziej zrównoważonym regionem w kraju, biorąc pod uwagę wszystkie analizowane wskaźniki. Województwa warmińsko-mazurskie i świętokrzyskie zajęły najniższe pozycje, wskazując na potrzebę intensywniejszych działań na rzecz poprawy ich sytuacji gospodarczej, społecznej i środowiskowej.

Analiza wykazała również, że dla obu zastosowanych metod rankingu, te same siedem województw osiągało wyniki powyżej średniej wartości wskaźnika zrównoważonego rozwoju. Regiony te – dolnośląskie, lubuskie, małopolskie, mazowieckie, pomorskie, śląskie i wielkopolskie – można uznać za wiodące pod względem rozwoju, wykazujące wyższą jakość życia, lepszą sytuację gospodarczą oraz bardziej zrównoważone podejście do ochrony środowiska.

W drugim etapie projektu zastosowano analizę skupień, aby dokonać podziału województw na cztery grupy (klastry) o różnym poziomie zrównoważonego rozwoju. Klaster 1 skupiał regiony o wysokim poziomie rozwoju gospodarczego i jakości życia, lecz z wyzwaniami środowiskowymi. Klaster 2 obejmował województwa o niższym poziomie rozwoju, z wyraźnymi problemami społecznymi i gospodarczymi. Klaster 3 charakteryzował się umiarkowanym rozwojem i stabilną sytuacją, podczas gdy klaster 4 obejmował regiony z wyzwaniami zarówno społecznymi, jak i środowiskowymi.